學過了numpy之後,接下來看看pandas的用法吧。在pandas中,提供了一些讀取不同檔案的方法。
讀取檔案的方法
import pandas as pd #載入pandas套件,縮寫為pd
pd.read_cvs('a.csv') #讀取csv檔
pd.read_json('a.json') #讀取json檔
pd.read_html('url') #讀取網頁
pd.read_excel('a.xlsx') #讀取xlsx檔
Series:建立索引的一為串列,通常用來處理時間序列相關的資料。
以下介紹一些有關series的用法
>>> import pandas as pd
>>> a = pd.Series([1,2,3])
>>> print(a)
0 1
1 2
2 3
dtype: int64
利用values顯示series中的元素
>>> a.values
array([1, 2, 3])
利用index顯示series中的元素
>>> a.index
RangeIndex(start=0, stop=3, step=1) #Series是從0開始到4結束,每個資料間隔為1
利用索引顯示元素
>>> a[1]
2
透過Series將TP字典的Key轉為index序列
>>> TP={"100":"中正區","103":"大同區","104":"中山區","105":"松山區","106":"大安區","108":"萬華區","110":"信義區","111":"士林區","112":"北投區","114":"內湖區","115":"南港區","116":"文山區"}
>>> pd.Series(TP)
100 中正區
103 大同區
104 中山區
105 松山區
106 大安區
108 萬華區
110 信義區
111 士林區
112 北投區
114 內湖區
115 南港區
116 文山區
dtype: object
今天學完pandas中Series的用法,明天再繼續學pandas中的DataFrame吧!
---20230920---